139 research outputs found

    Analyse de données pour des graphes étiquetés

    No full text
    International audienceNous proposons une méthode de fouille de données pour un graphe dont les sommets sont étiquetés. Deux approches sont décrites et illustrées sur un jeu de données réelles : elles permettent une représentation du graphe qui combine les informations sur sa structure et sur la valeur de ses étiquettes. Cette visualisation peut être utilisée à des fins d'interprétation pour apporter des informations plus nuancées sur la caractérisation des sommets du graphe

    sexy-rgtk: a package for programming RGtk2 GUI in a user-friendly manner

    No full text
    National audienceThere are many di erent ways to program Graphical User Interfaces (GUI) in R. (Lawrence and Verzani, 2012) provides an overview of the available methods, describing ways to program R GUI with RGtk2, qtbase and tcltk. More recently, the package shiny, for building interactive web applications, was also released (the rst version has been published on December, 2012). By automatically indexing all objects and methods available in RGtk2, we developed a method for creating GTK2-based GUI, in a friendlier and more compact manner. Widgets are accessible with simple functions and options, as is more natural for a R language programmer

    A comparison between dissimilarity SOM and kernel SOM for clustering the vertices of a graph

    Get PDF
    International audienceFlexible and efficient variants of the Self Organizing Map algorithm have been proposed for non vector data, including, for example, the dissimilarity SOM (also called the Median SOM) and several kernelized versions of SOM. Although the first one is a generalization of the batch version of the SOM algorithm to data described by a dissimilarity measure, the various versions of the second ones are stochastic SOM. We propose here to introduce a batch version of the kernel SOM and to show how this one is related to the dissimilarity SOM. Finally, an application to the classification of the vertices of a graph is proposed and the algorithms are tested and compared on a simulated data set

    Analysis of the influence of a network on the values of its nodes : the use of spatial indexes.

    Get PDF
    National audienceA growing number of data are modeled by a graph that can sometimes be weighted: social network, biological network... In many situations, additional informations are provided with these relational data, related to each node of the graph: this can be a membership to a given social group (for social networks) or to a given proteins family (for protein interactions network). In this case, a important question is to understand if the value of this additional variable is influenced by the network. This paper presents exploratory tools to address this question that are based on tests coming from the field of spatial statistic. The use of these tests is illustrated on several examples, all coming from the social network framework

    Représentation d'un grand réseau à partir d'une classification hiérarchique de ses sommets

    Get PDF
    International audienceGraph visualization is an important tool to understand the main features of a network but, when the number of nodes in the graph exceeds few hundreds, standard visualization methods are computationally expensive. Moreover, force directed algorithms do not help the understanding of the community structure of the newtork, if is exists. In this paper, a new visualization method based on a hierarchical clustering of the nodes of the graph is proposed. It can handle graphs having several thousands nodes in a few seconds. Several simplified representations of the graph are accessible, giving the user the opportunity to understand the macroscopic organization of the network and then, to focus on some particular parts of the graph. This refining process is controlled as follows. Partitions under consideration are evaluated via the classical modularity quality measure. A distribution of the quality measure in the case of graphs without structure is obtained by applying the proposed method to random graphs with the same degree distribution as the graph under study. Then only significant partitions are shown during the refining process. This approach is illustrated on several public datasets and compared with other visualization methods meant to emphasize the graph communities. It is also tested on a large network built from a corpus of medieval land charters

    Consistency of Derivative Based Functional Classifiers on Sampled Data

    Get PDF
    International audienceIn some applications, especially spectrometric ones, curve classifiers achieve better performances if they work on the mm-order derivatives of their inputs. This paper proposes a smoothing spline based approach that give a strong theoretical background to this common practice

    Topologically Ordered Graph Clustering via Deterministic Annealing

    Get PDF
    International audienceThis paper proposes an organized generalization of Newman and Girvan's modularity measure for graph clustering. Optimized via a deterministic annealing scheme, this measure produces topologically ordered graph partitions that lead to faithful and readable graph representations on a 2 dimensional SOM like planar grid

    Classification et visualisation de graphes avec SOMbrero

    No full text
    National audienceRécemment, les données structurées et notamment les graphes ont connu un intérêt croissant. Celles-ci ont en effet de multiples applications en sciences humaines et sociales, en biologie ou en informatique. Pour comprendre les structures complexes modélisées par les graphes, une approche courante consiste à combiner classification des sommets du graphe avec visualisation : cela permet de mettre en valeur la structure macroscopique du graphe (classes denses de sommets et leurs relations) avant de se focaliser sur les détails à l'intérieur de telle ou telle classe. En particulier, le graphe est parfois représenté sur la base de la classification, de manière simplifiée : chaque classe est représentée par un méta-sommet, d'aire proportionnelle au nombre de sommets du graphe initial affectés à la classe correspondante, et les relations entre les méta-sommets sont représentées par des arêtes dont l'épaisseur est proportionnelle au nombre de liens entre les sommets des deux classes. Cette proposition se focalisera sur l'utilisation du package R SOMbrero pour l'exploration de graphes et la recherche d'une représentation simplifiée comme décrite plus haut

    SOMbrero : Cartes auto-organisatrices stochastiques pour l'intégration de données décrites par des tableaux de dissimilarités

    No full text
    National audienceDans de nombreuses situations réelles, les individus sont décrits par des jeux de données multiples qui ne sont pas nécessairement de simples tableaux numériques mais peuvent être des données complexes (graphes, variables qualitatives, texte...). Un cas typique est celui des graphes étiquetés dans lequel les individus (les sommets du graphe) sont décrits à la fois par leurs relations les uns aux autres mais aussi par des attributs de natures diverses. Dans (Villa-Vialaneix et al, 2013 ; Olteanu et al , 2013), nous avons proposé d'utiliser des cartes auto-organisatrices (Kohonen, 2011) pour combiner classification et visualisation en projetant les individus étudiés sur une grille de faible dimension. Notre approche permet de traiter des données non numériques par le biais de noyaux ou de dissimilarités, et est basée sur une version stochastique de l'apprentissage de cartes auto-organisées. Les différentes dissimilarités sont combinées et la combinaison est optimisée au cours de l'apprentissage de la carte
    corecore